快讯列表

关于 ATLAS 模型 的快讯列表

时间 详情
2025-09-17
03:00
谷歌发布 ATLAS:一千万 Token 记忆式大模型,BABILong 得分 80%,八项问答平均 57.62%

根据 @DeepLearningAI,谷歌研究人员发布了 ATLAS,这是一种类 Transformer 的语言模型,用可训练内存模块替代注意力机制,支持最多一千万 token 的输入;来源:@DeepLearningAI。 根据 @DeepLearningAI,团队训练了一个 13 亿参数模型于 FineWeb,并在推理时仅更新内存模块;来源:@DeepLearningAI。 根据 @DeepLearningAI,ATLAS 在一千万 token 输入的 BABILong 基准上取得 80% 得分,并在八个问答基准上平均 57.62%,优于 Titans 与 Transformer++;来源:@DeepLearningAI。 根据 @DeepLearningAI,来源未提及加密货币,但其公布的长上下文与记忆增强推理基准为交易者评估 AI 相关叙事提供可跟踪的性能数据;来源:@DeepLearningAI。

来源